这个代码是用来统计某一csv文件的某一列数据,对该列数据进行分类并且进行计数

这个代码是用来统计某一csv文件的某一列数据,对该列数据进行分类并且进行计数

python版本为python2.7

下面直接上代码

#a.csv is three rows csv
#这个代码是用来统计某一csv文件的某一列数据,对该列数据进行分类并且进行计数



import pandas as pd
import re
import csv
import sys


path='C:\\Users\\hg\\Desktop\\a\\a.csv'#文件路径不能包含中文,否则会报错


df=pd.read_csv(path,'utf-8',engine='python')#编码格式utf-8
df.head()
print(df)


df.describe()

import numpy as np
#公共部分


#统计出行方式
address=pd.read_csv(path,usecols=[0])   #提取想要的数据列,0是列索引

address.to_csv("C:\\Users\\hg\\Desktop\\b\\d.csv")  #文件输出

path2='C:\\Users\\hg\\Desktop\\b\\d.csv'   #文件读取


df2=pd.read_csv(path2,'utf-8',engine='python')

df3=np.unique(address)      #调用unique函数对该列数据分组,返回每一组的组名


print(df3)

ts = pd.Series(address['driving'].values, index=address['driving'])   #分组后计数返回该组的组名和每一个名称的数量

ts.describe()

ts.value_counts()


wuqu=ts.value_counts()   #格式转换加文件输出,series无法直接输出为csv
wuqu1=pd.DataFrame(ts.value_counts())
wuqu1.to_csv('C:\\Users\\hg\\Desktop\\b\\e.csv')    #输出文件是包含组名以及个数的csv文件
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值